Introdução

Neste trabalho, vamos modelar o preço de venda de imóveis a partir de dados relativos a uma amostra de 27 imóveis. As variáveis desse conjunto de dados são:

  • imposto: imposto do imóvel (em US$ 100);

  • areaT: área do terreno (em 1.000 pés quadrados);

  • areaC: área construída (em 1.000 pés quadrados);

  • idade: idade da residência (em anos);

  • preco: preço de venda do imóvel (em US$ 1.000).

O modelo ajustado será o normal linear com variável resposta preço de venda e as demais variáveis como explicativas. Em seguida, utilizaremos o método AIC para selecionar as variáveis explicativas, faremos uma análise de diagnóstico com o modelo selecionado e interpretaremos os coeficientes estimados.

Pacotes

library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5     v purrr   0.3.4
## v tibble  3.1.2     v dplyr   1.0.7
## v tidyr   1.1.3     v stringr 1.4.0
## v readr   1.4.0     v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(plotly)
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout

Os dados

dados = read.table("imoveis.dat")

dados = dados %>% rename(imposto = V1,
                         areaT = V2,
                         areaC = V3,
                         idade = V4,
                         preco = V5)

attach(dados)

plot_ly(type = "box") %>%
  add_boxplot(y = imposto, name = "imposto") %>% 
  add_boxplot(y = areaT, name = "área do terreno") %>% 
  add_boxplot(y = areaC, name = "área construída") %>%
  add_boxplot(y = idade, name = "idade do imóvel") %>%
  add_boxplot(y = preco, name = "preço de venda")

Análise Exploratória dos Dados